Lista taxonómica de referencia de anfibios de Costa Rica

Introducción

La lista taxonómica de referencia de anfibios (clase Amphibia) de Costa Rica de BIODATACR permite integrar datos de diferentes publicadores en el sistema e implementar controles de calidad en la ortografía de los nombres científicos, su sinonimia, sus autores y su clasificación, entre otros aspectos.

La siguiente tabla muestra las 216 especies de la lista. La columna Estado indica si el nombre científico es aceptado o un sinónimo. Con los controles de la tabla, puede modificar la cantidad de especies desplegadas, ordenar los datos y realizar búsquedas.

La lista está disponible para descarga en formato de valores separados por comas (CSV) en:
lista taxonómica de referencia de anfibios de Costa Rica

El repositorio con los datos y el código fuente de los programas está en la dirección:
https://github.com/biodatacr/lista-taxonomica-referencia-anfibios

En el resto de este documento, se describe el proceso de elaboración de la lista y se presentan algunas visualizaciones de los datos que contiene.

Elaboración de la lista

El proceso inició con una lista proporcionada por un grupo de expertos en anfibios de Costa Rica, cuya estructura y formato se refinaron progresivamente para que los nombres científicos pudieran ser verificados en la Infraestructura Mundial de Información en Biodiversidad (GBIF), una organización dedicada a la integración de datos de biológicos de todo el mundo y, específicamente, en su lista taxonómica de referencia o Backbone Taxonomy. Esta lista de GBIF se construye a partir del Catálogo de la Vida (COL) y se completa con cerca de 100 fuentes adicionales de datos. Es actualizada periódicamente por medio de un proceso automático.

La verificación de los nombres científicos en la lista de GBIF se llevó a cabo mediante un programa en el lenguaje R y su paquete rgbif, el cual proporciona acceso a los servicios web que componen la interfaz de programación de aplicaciones (API) de GBIF. Como resultado de esta verificación, se detectaron errores ortográficos, sinónimos, y se obtuvieron elementos adicionales de datos, como autores y niveles taxonómicos superiores, entre otros.

Seguidamente, se describen en detalle las etapas del proceso de elaboración de la lista.

1. Lista inicial

La lista inicial contiene 216 especies de anfibios de Costa Rica y fue recopilada en el contexto del proyecto Biodiversidad en cifras (Bermúdez Rojas, Tania & Obando Acuña, Vilma, 2021). El documento fue facilitado en formato XLSX (Microsoft Excel).

2. Lista intermedia

Se removieron de la lista inicial aquellas filas que no corresponden a datos (ej. título, autor, fecha, etc.) y el resultado se guardó en formato CSV, como una lista intermedia. De esta manera, se obtuvo un conjunto de datos debidamente estructurado, con una fila por cada especie y una columna por cada elemento de datos.

3. Lista final

La lista intermedia generada en el paso anterior se utilizó como entrada del programa generar-lista-taxonomica.R, el cual, en resumen, ejecuta las siguientes tareas:

  • “Limpia” la columna especie al remover espacios en blanco innecesarios, caracteres especiales (i.e. no alfanuméricos) y palabras siguientes a la segunda (ej. autores), de manera que se conserven solamente las dos primeras palabras: género y epíteto específico (ej. Caiman crocodilus). El resultado se guarda en una nueva columna llamada name.

  • Busca los nombres científicos de la columna name en la lista de referencia taxonómica de GBIF y para cada uno se recuperan elementos de datos del DwC como:

    • Nombre científico (género + epíteto específico + autores).
    • Niveles taxonómicos (reino, clase, …, familia, género, especie).
    • Estado (aceptado, sinónimo).
    • Exactitud de la búsqueda (exacta, difusa).
    • Nivel de confianza de la búsqueda (0…99).

La lista final consta de los 216 nombres de especies de la lista original, revisados y corregidos, junto con los restantes elementos de datos recuperados de la lista de referencia taxonómica de GBIF.

Los elementos de datos (i.e. columnas) de la lista final están definidos de acuerdo con el Darwin Core (DwC), un estándar orientado a facilitar la publicación e integración de datos de biodiversidad, el cual incluye un glosario de términos comúnmente utilizados en listas de especies, registros de colecciones biológicas, observaciones de ciencia ciudadana y eventos de monitoreo, entre otras fuentes (Wieczorek et al., 2012). La lista se empaquetó y distribuyó en formato Darwin Core Archive (DwC-A), un archivo comprimido tipo ZIP que contiene archivos de datos en formato CSV y descriptores en formato XML. El DwC-A es el formato preferido para la publicación de datos en GBIF y otras plataformas de integración.

Visualización de los datos

En esta sección, se presentan algunas visualizaciones de las especies de la lista y de sus registros de presencia. Estos últimos fueron recuperados del portal de datos de GBIF.

Especies

Lista final e indicadores de la búsqueda de nombres

La siguiente tabla muestra las 216 especies de la lista final, junto con el nombre de cada especie en la lista inicial y las columnas correspondientes a exactitud y nivel de confianza de la búsqueda.

Diferencias entre la lista inicial y la lista final

La siguiente tabla muestra las especies en las que hay alguna diferencia entre el nombre proporcionado en la lista inicial y el resultante en la lista final. Las diferencias se deben principalmente al uso de sinónimos y a errores ortográficos.

Cantidad de especies por orden y familia

Registros de presencia

Para tener un idea de los datos de presencia disponibles para las especies de la lista, se realizó una consulta al Portal de datos de GBIF. Se encontraron 43383 registros de 195 especies.

Cantidad de registros de presencia por especie

Especies en GBIF reportadas en Costa Rica y ausentes en la lista de referencia

Se realizó otra consulta al Portal de datos de GBIF, de todos los registros de presencia de la clase Amphibia (todas las especies, no solo las de la lista de referencia), la cual retornó 46620 registros de 237 especies.

Las siguientes son las especies que retornó la consulta y no están en la lista de referencia.

Mapa de distribución

El siguiente mapa muestra la distribución geográfica de los registros de presencia de las 43383 especies de la lista de referencia. Se incluyó una capa para cada uno de los órdenes taxonómicos, las cuales pueden activarse y desactivarse con el control de capas. Al hacer sobre cada punto, pueden observarse algunos elementos de datos del registro de presencia correspondiente.

Referencias

Bermúdez Rojas, Tania, & Obando Acuña, Vilma. (2021). Biodiversidad en cifras: Avances en el conocimiento de especies en Costa Rica. Biocenosis, 32(2). https://doi.org/10.22458/rb.v32i2.3899
Wieczorek, J., Bloom, D., Guralnick, R., Blum, S., Döring, M., Giovanni, R., … Vieglais, D. (2012). Darwin Core: An Evolving Community-Developed Biodiversity Data Standard. PLOS ONE, 7(1), e29715. https://doi.org/10.1371/journal.pone.0029715